Lookerの可視化(Vizualization)で何が出来るか確認してみる – ワードクラウド(Word Cloud)編 #looker
Lookerでは、対象となるデータ理解するための様々な可視化(Visualization)機能が利用可能です。
当エントリは、Lookerの可視化機能で利用可能なグラフの1つである『ワードクラウド(Word Cloud)』について、その概要と『どんな見せ方が出来るのか』について見ていきたいと思います。
目次
ワードクラウド(Word Cloud)とは
ワードクラウド、場合によってはタグクラウドとも呼ばれるこの表示形式。Wikipediaによると以下の様な解説となっています。件数の大きさ、多さを文字のサイズによって表す表現方法ですね。
タグ・クラウド (tag cloud、 ワードクラウド 、またはビジュアルデザインの重み付きリスト )はタグの視覚的記述を指す。テキストデータの斬新な視覚表現であり、通常はWebサイトでキーワードメタデータ(タグ)を描写したり、自由形式のテキストを視覚化するが、通常タグは単一の単語であり、各タグの重要性はフォントサイズまたは色で示される[2]。 この形式は、最も重要な用語をすばやく認識して、その相対的な重要度を判断するのに役立つが Webサイトのナビゲーション支援として使用される場合、用語はタグに関連付けられたアイテムにハイパーリンクされる。
可視化実践
では実践してみましょう。今回の可視化では、ブログ投稿データの『特集カテゴリ』の情報を使ってみたいと思います。Developers.IOでは、投稿それぞれに『特集カテゴリ』というアグを付けています。これは製品やサービスの個別認識情報に該当するものを付与し、そのエントリではどういう製品やサービスについて言及しているかどうか、が分かるようになっています。それぞれはリンクになっており、遷移する事で該当する特集カテゴリの記事一覧を確認する事が出来ます。
過去分を含めて全ての情報をカウントして出してみました。『AWS特集』が圧倒的ですね...!
ひとまずこのままで出してみましょう。表示形式から『Word Cloud』を出してみます...
出してみましたが、『AWS特集』の件数が圧倒的過ぎて、その他の情報が霞んでしまいました。サンプルでお見せするにはあまりよろしく無いですねw
上位数個をフィルタを使って取り除いておきます。
また、件数が少ないものをあまり出してもアレなので、上位50件に内容を絞ってみました。
絞った結果が以下となります。やはりAWS関連は強いですね!AlteryxもEC2に迫る勢いのカウント数でした。
さて、この中でLookerはどの辺に居るでしょう...居ました!でもちっちゃいw Lookerは当ブログで取り扱うようになってまだ1年未満。これからどんどん増えていくことになるかと思います。頑張れLooker!というかLookerエントリを書く人たち!(自分を含む)
まとめ
というわけで、Lookerの可視化機能で利用可能な『ワードクラウド(Word Cloud)』に関する内容のご紹介でした。
見た目のインパクト、わかりやすさでいうと『ワードクラウド』は手軽に扱える表示形式だと思います。ワードそのもので相手に訴えかけるようなデータを見せたい場合は是非使ってみてはいかがでしょうか。